71 research outputs found

    When the signal is in the noise: Exploiting Diffix's Sticky Noise

    Get PDF
    Anonymized data is highly valuable to both businesses and researchers. A large body of research has however shown the strong limits of the de-identification release-and-forget model, where data is anonymized and shared. This has led to the development of privacy-preserving query-based systems. Based on the idea of "sticky noise", Diffix has been recently proposed as a novel query-based mechanism satisfying alone the EU Article~29 Working Party's definition of anonymization. According to its authors, Diffix adds less noise to answers than solutions based on differential privacy while allowing for an unlimited number of queries. This paper presents a new class of noise-exploitation attacks, exploiting the noise added by the system to infer private information about individuals in the dataset. Our first differential attack uses samples extracted from Diffix in a likelihood ratio test to discriminate between two probability distributions. We show that using this attack against a synthetic best-case dataset allows us to infer private information with 89.4% accuracy using only 5 attributes. Our second cloning attack uses dummy conditions that conditionally strongly affect the output of the query depending on the value of the private attribute. Using this attack on four real-world datasets, we show that we can infer private attributes of at least 93% of the users in the dataset with accuracy between 93.3% and 97.1%, issuing a median of 304 queries per user. We show how to optimize this attack, targeting 55.4% of the users and achieving 91.7% accuracy, using a maximum of only 32 queries per user. Our attacks demonstrate that adding data-dependent noise, as done by Diffix, is not sufficient to prevent inference of private attributes. We furthermore argue that Diffix alone fails to satisfy Art. 29 WP's definition of anonymization. [...

    Development of a reliable extraction method for the recovery of total genomic DNA from woodchip colonizing biofilm involved in gas biofiltration

    Get PDF
    [Abstract] This preliminary study focused on a critical step for the characterization of microbial ecosystem involved in biofiltration. Two aspects of nucleic acid recovery were explored: (i) cell dispersion (three methods tested) and (ii) total DNA extraction (four methods tested). The objective is to select the optimal combination of desorption/extraction methods, allowing subsequent molecular investigations to be reliable. Three relevant criteria are used to assess extraction efficiency: DNA amount and purity, and subsequent amplification feasibility

    Solving Artificial Intelligence’s Privacy Problem

    Get PDF
    Artificial Intelligence (AI) has potential to fundamentally change the way we work, live, and interact. There is however no general AI out there and the accuracy of current machine learning models largely depend on the data on which they have been trained on. For the coming decades, the development of AI will depend on access to ever larger and richer medical and behavioral datasets. We now have strong evidence that the tool we have used historically to find a balance between using the data in aggregate and protecting people’s privacy, de-identification, does not scale to big data datasets. The development and deployment of modern privacy-enhancing technologies (PET), allowing data controllers to make data available in a safe and transparent way, will be key to unlocking the great potential of AI

    Ce qu’il y a à trouver, ce qu’il y a à savoir

    No full text
    Champ pluridisciplinaire en expansion, niche économique, la recherche d’informations est une notion qui se développe depuis le vingtième siècle. Mais avant tout, qu’est-ce que l’« information » ? On peut considérer qu’un ensemble de données véhicule de l’information s’il présente … Continue reading

    Digital Editions and Text Processing

    No full text
    Dans ce billet de blog, découvrez un compte rendu de l’article « Digital Editions and Text Processing » de Dino Buzzeti, paru dans Text Editing, Print and the Digital World (2009). On assiste actuellement à une utilisation de plus en plus massive des outils numériques en sciences humaines. Pourtant, les universitaires restent globalement réticents face à ces mutations, perdus entre des technologies trop complexes ou trop chronophages. L’ordinateur reste un outil purement technique. Pour Clau..

    Ce qu’il y a à trouver, ce qu’il y a à savoir

    No full text
    Champ pluridisciplinaire en expansion, niche économique, la recherche d’informations est une notion qui se développe depuis le vingtième siècle. Mais avant tout, qu’est-ce que l’« information » ? On peut considérer qu’un ensemble de données véhicule de l’information s’il présente du sens, du contenu, voire une certaine complexité. Or plus une ressource est complexe, plus il est facile de s’y perdre. La recherche et l’extraction d’information permettent d’explorer et de retrouver du sens. Ces ..

    Associations et syndicats de la création numérique

    No full text
    Retrouvez sur SpeakerDeck ma présentation des associations et syndicats des professionnels de la création numérique, organisée autour des points suivants : distinction entre « association » et « syndicat » en France ; organisation des syndicats entre patronat et syndicat ; typologie des organisations syndicales du secteur de la création numérique ; questionnement de la structure syndicale face aux développement du logiciel libre et de pratiques alternatives. Cette présentation s'est terminée..

    Great Britain Historical Geographical Information System

    No full text
    Les SIG historiques Un système d’information géographique (SIG) regroupe l’organisation et l’analyse de données spatiales, un vaste champ allant des répartitions démographiques aux analyses fines de l’environnement. On peut distinguer trois périodes dans leur évolution : de la fin des années 50 au milieu des années 70, les débuts de l’informatique conduisent aux premières cartographiques numériques (avec des outils adaptés aux traitements de ces données) ; jusqu’aux années 80, les outils se ..

    Great Britain Historical Geographical Information System

    No full text
    Les SIG historiques Un système d'information géographique (SIG) regroupe l'organisation et l'analyse de données spatiales, un vaste champ allant des répartitions démographiques aux analyses fines de l'environnement. On peut distinguer trois périodes dans leur évolution : de la fin des années 50 au milieu des années 70, les débuts de l'informatique conduisent aux premières cartographiques numériques (avec des outils adaptés aux traitements de ces données) ; jusqu'aux années 80, les outils se ..
    • …
    corecore